Научная статья на тему 'Информационный анализ игры в шахматы'

Информационный анализ игры в шахматы Текст научной статьи по специальности «Математика»

CC BY
1213
134
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Ляхов Александр Федорович

Рассматривается метод построения игровой стратегии, основанный на оценке целевой функции противника. Приводится информационный анализ различных стадий шахматной партии.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Информационный анализ игры в шахматы»

Ляхов Александр Федорович

ИНФОРМАЦИОННЫЙ АНАЛИЗ ИГРЫ В ШАХМАТЫ

Шахматы - это всегда игра, которая иногда становится искусством.

М. Ботвинник.

Интерес к компьютерным шахматам обусловлен двумя причинами. С одной стороны, компьютерные шахматы являются одной из составляющих игровой индустрии, а с другой стороны, разработка и создание шахматных игровых программ тесно связана с проблемами создания искусственного интеллекта. Первые шахматные компьютерные программы были созданы в 50-60-е годы прошлого века. Эти программы строились на алгоритмах последовательного анализа позиций в партии. Однако следует заметить, что шахмат- —— ная партия обычно состоит из тридцати-сорока ходов, и существует около 1043 вариантов развития игры, поэтому применение классических методов последовательного анализа позиций связано с непреодолимыми вычислительными трудностями.

При игре в шахматы перед игроком открыта вся позиция, поэтому принято считать, что шахматы относятся к классу игр с полной информацией. Но количество информации, которое получает игрок, изучая позицию, зависит от степени его подготовки. В игре имеется еще один фактор, вносящий неопределенность, и он связан с уровнем подготовки противника.

Большинство современных шахматных и шашечных игровых программ созда-

вались для игры с идеальным противником, делающим абсолютно правильные ходы [1]. На практике игрок имеет дело с партнером (с игровой программой), возможности которого ограничены. Поэтому можно предложить другой принцип построения

) игровых программ, а именно на первом этапе анализа партии попытаться оценить целевую функцию противника, а на втором этапе - использовать эти знания для выбора, может быть, не абсолютно правильной и не самой оптимальной страте-__ - гии, но стратегии, приводящей к выигрышу. Неопределенность в действиях противника, большое количество вариантов развития партии позволяют поставить вопрос о возможности применения методов теории вероятности и теории информации для поиска и анализа игровой стратегии. Предлагаемый в работе подход позволил поставить задачу о рефлексивном управлении противником [2], то есть, совершая определенные ходы, игрок создает у противника представление о своей оценочной функции, а затем в критической ситуации отступает от ожидаемого поведения.

В дальнейшем будут широко использоваться некоторые основные понятия теории вероятностей и теории информации [3].

Вероятность события А будем вычислять по формуле Р(А) = т/п , где п - число всех равновозможных элементарных событий, вытекающих из условий данного испытания, а т - число равновозможных событий, которые благоприятствуют событию А.

Случайные события характеризуются тем, что нет полной уверенности в их наступлении, то есть имеется некоторая неопределенность при их изучении. Понятно, что степень этой неопределенности в различных случаях может быть разной.

В качестве меры степени неопределенности случайных событий будем использовать понятие энтропии, предложенное Шенноном [3; 4], которая выражается формулой: п

Н = -£ Р log2 Р .

¿=1

Определив энтропию как меру степени неопределенности состояния случайного объекта, можно видеть, что в результате получения сведений об объекте степень неопределенности может быть изменена.

Пусть система в начальный момент времени с точки зрения наблюдателя А обладает энтропией Н0. После получения наблюдателем сведений о состоянии системы значение энтропии изменилось и приняло значение Н1.

Количеством информации, содержащимся в полученном сведении, называется разность энтропий

I = н о - н.

СРАВНИТЕЛЬНЫЕ ОЦЕНКИ СИЛ ШАХМАТНЫХ ФИГУР

В теории шахмат экспертно получена приблизительная ценность фигур. Например, в книге В. Стей-ница «The Modern Chess Instructor» приводится следующая оценка: принимая пешку за единицу, конь оценивается в 3,05; слон в 3,50; ладья в 5,48 и ферзь в 9,94. В работах по теории информации К. Шеннона [4]

приводится другая оценка фигур: ферзь - 9, ладья - 5, слон - 3, конь - 3, пешка - 1. Эти оценки обычно обосновываются качественными пояснениями [5].

Можно видеть, что ценность фигуры связана с ее подвижностью, то есть зависит от возможности фигуры перемещаться по полю и от вероятности нахождения в той или иной клетке. Чем выше подвижность фигуры, тем больше степень неопределенности ее возможного хода. Эта неопределенность и позволяет в качестве меры мобильности фигуры взять энтропию.

Для построения шкалы ценности фигур рассмотрим простейшую позицию, когда на поле расположена всего одна изучаемая фигура.

1. Пешка. Если пешка находится на второй линии, то она может с равной вероятностью занять две клетки. В этом случае Р = 1/2, следовательно, энтропия будет равна: 2 , ,

H = -t1 log2 1 = 1.

7=1 2 2

Если пешка находится на третьей, четвертой, пятой и шестой линиях, то она может занять только одну клетку и ее энтропия будет равна нулю: H = -1 • log 21 = 0.

Если пешка находится на седьмой линии, то следующим совершается ход превращения. В этот момент пешка качественно меняется, поэтому энтропия пешки резко увеличивается.

2. Слон. Если слон расположен в центре поля, то он может с равной вероятностью p. = 113 попасть на тринадцать клеток. В этом случае энтропия слона достигает максимального значения, и она будет равна:

V- 1 , 1 , max H = -2_ 13 log213 = log213 » 3,7.

Если слон располагается у стенки, то он может с равной вероятностью p. = 1/1 сделать семь ходов, при этом энтропия его будет минимальна:

minH = log2 - = log2 7 » 2,81.

i=1 7 7

3. Конь. Аналогично для коня:

V 1, 1 ,

max H = log2 - = log2 8 = 3.

1 ,

min H = log^ = log2 2 = 1.

i=i 2 2

4. Ладья.

max H = min H =

= -E = log214 »3,8L

5. Ферзь.

27 1 1

maxH = —log2 27 = log2 27 » 4,76.

21 1 1

min H = — log2 21 = log2 21» 4,39.

6. Король.

8 1 1

max H = log^ = log2 8 = 3.

¿=i 8 8

^ 1 1

min H log^ = log2 3 » 1,58.

¡•=1 3 3

В реальных партиях полученные значения будут зависеть от вида конкретной позиции.

Заметим, что потеря фигуры приводит к уменьшению возможностей игрока и соответственно ведет к уменьшению степени неопределенности его ходов.

ИНФОРМАЦИОННЫЙ АНАЛИЗ ДЕБЮТА ШАХМАТНОЙ ПАРТИИ

В теории шахмат принято разделять партию на три стадии развития игры: дебют, миттельшпиль и эндшпиль. В дебюте, на первых ходах, пока сохраняется количественное равенство и позиции качественно близки, основные изменения в партии могут быть оценены с помощью изменения энтропии игроков.

Предположим, что неизвестный игрок А может сделать любой возможный ход с

равной вероятностью. Игрок В, сделав ответный ход, будет ожидать второй ход игрока А. Вычислим, какой именно из вариантов первого хода игрока А наиболее рационален с точки зрения увеличения неопределенности (энтропии) ожидаемого второго хода А для игрока В.

В начальной позиции существует двадцать вариантов ходов с каждой стороны: шестнадцать ходов пешками и четыре хода конем: каждый из этих ходов может быть совершен равновероятно с р. = 1/20 . Энтропия игрока в начале партии равна:

V- 1 , 1 ,

Н = -X 20 = 20 » 4,32.

Проанализируем различные варианты первого хода:

а2 - а3. г = 1...19, р = 119,

19 1 1

Н1 = -X—1082 — = 108219 » 4,25.

1 19 19 &2

Этот ход приводит к уменьшению энтропии игрока В перед вторым ходом. Из теории дебютов известно, что он равносилен передаче хода противнику.

а2 - а4. г = 1...21, Рг = 1/21,

21 1 1 н 2 =-Х—1о§2- = 1082 21» 4,39.

г=1 21 21

Этот ход приводит к незначительному увеличению энтропии и в теории не рассматривается.

а2 - а4. г = 1...28, р = 128,

28 1 1 н 3 =-1-1082- = 1082 28 » 4,80.

г=1 28 28

В результате этого хода происходит значительное увеличение энтропии.

Максимальное изменение энтропии имеет место при ходе

е2 - е4. г = 1...30, р = 130,

30 1 1

н4 =-Х^1082 — = 1082 30 » 4,90.

г =1 30 30

Следует заметить, что ходы, связанные с ферзевой или королевской пешками, присутствуют в подавляющем числе дебютов.

Разность энтропий до хода и после него говорит об информационной ценности того или иного хода.

Таблица 1.

Белые фигуры (Таубенгауз) Черные фигуры (Тарраш)

№ ход Р н ход Р н

1 с4 1/22 4,46 е6 1/30 4,9

2 Кс3 1/26 4,7 ё5 1/35 5,13

3 е3 1/35 5,13 с5 1/30 4,9

4 К3 1/35 5,13 ё4 1/31 4,95

5 Ке2 1/27 4,76 Кс6 1/34 5,09

6 ^3 1/29 4,86 Ъ5 1/35 5,13

7 а3 1/29 4,86 Ъ4 1/37 5,21

8 Ке2 1/27 4,76 е5 1/40 5,32

9 ё3 1/31 4,95 а5 1/41 5,36

10 Ъ3 1/31 4,95 Сё7 1/43 5,43

11 е4 1/33 5,04 £6 1/41 5,36

12 КЬ2 1/34 5,09 g5 1/42 5,39

Приведем информационный анализ дебюта партии Таубенгауз - Тарраш (Гамбург, 1885) [4]. Первый ход белых и черных может быть выбран с вероятностью рг = 120. Начальная энтропия равна: Н0 » 4,32.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Изменение энтропии в течение игры показано в таблице 1.

Изменение энтропии показано на графике (рисунок 1).

Можно видеть, что после двенадцатого хода энтропия черных больше, чем энтропия белых, то есть позиция черных более предпочтительна, чем позиция белых. Это же показывает и качественный анализ, приведенный в работе А.В. Лысенко [4]: «Начало партии дает возможность значительно стеснить игру белых. За исключением пешки "Ь" силы черных готовы к решающему

прорыву; белые стеснены настолько, что не смеют, кажется, и шевельнуться. Пространственный перевес черных виден невооруженным глазом».

Можно сформулировать следующее утверждение: хороший ход - ход, сделанный с увеличением своей энтропии и с уменьшением энтропии противника.

ИНФОРМАЦИОННЫЙ АНАЛИЗ ЭНДШПИЛЯ

Информационный подход можно легко применить для анализа эндшпилей, так как в этом случае на доске мало фигур и можно учесть все возможные позиции перед ходом. Проанализируем простую позицию: на поле находятся два короля и ладья.

Цель игры белых - максимально быстро, то есть за минимальное число ходов, поставить мат противнику, а черных - сделать как можно больше ходов до мата. Пусть черный игрок не просчитывает ходы (рисунок 2).

Рисунок 1.

Рисунок 2.

Таблица 2.

Белые фигуры Черные фигуры

№ ход Р Н I ход Р Н I

1 Ле8 1/14 3,81 0,19 Крс5 1/8 3 0

2 Лё8 1/14 3,81 0 КрЬ6 1/8 3 0

3 Лс8 1/14 3,81 0 КрЬ1 1/4 2 1

4 Лс1 1/13 3,1 0,11 КрЬ6 1/5 2,32 -0,32

5 КрЕ2 1/19 4,25 -0,55 КрЬ5 1/5 2,32 0

6 Кр£2 1/19 4,25 0 КрЬ4 1/5 2,32 0

1 Кре2 1/19 4,25 0 КрЬ3 1/5 2,32 0

8 Крё2 1/16 4 0,25 КрЬ2 1/3 1,58 0,14

9 Лс3 1/15 3,91 0,09 Кра2 1/2 1 0,58

10 Крс2 1/14 3,81 0,1 Кра1 1 0 1

11 Ла3 1/18 4,11 -0,36 - - - -

Белые фигуры могут попасть на 16 клеток, поэтому существует шестнадцать вариантов первого хода с вероятностью каждого pi = 1/16. Начальная энтропия белых будет равна:

16 1 1

Н = -Х 1610§216 = 1о§216 = 4'

Черный король может попасть всего на 8 клеток, то есть сделать восемь ходов с вероятностью каждого р. = 0,125, начальная энтропия будет равна: 8 1 1 н = -Х81о§28 = 1о§2§ = 3'

Этому элементарному с точки зрения шахматной теории эндшпилю может быть дана информационная трактовка. Белые ходят таким образом, чтобы сделать энтропию черных минимальной. Изменение энтропии в течение игры показано в таблице 2.

Изменение энтропии в течение игры приведено на графике (рисунок 4).

Приведем анализ этюда-трио, когда на поле находятся два короля и белая пешка. Эта интересная позиция была напечатана в журнале «Квант» за 1998 год, № 1 (рисунок 3).

Белые фигуры могут попасть на семь клеток, поэтому первый ход может быть совершен с вероятностью каждого хода р. = 1/1 и начальная энтропия белых будет равна:

Н = -Х^^ = ^7 »2,81'

г=1 7 7

Черный король может попасть на 8 клеток, то есть сделать восемь ходов с вероятностью каждого р. = 0,125, начальная энтропия будет равна: 8 1 1 Н ^Х^^в = 1о§28 =3'

Существует два варианта развития игры. Рассмотрим каждый из них.

номер хода

Белые

Черные

Рисунок 3. рисунок 4.

^НБелые -Черны

Рисунок 5.

тегия позволяет провести пешку до последней горизонтали и добиться выигрыша. Изменение энтропии приведено в таблице 4 и на графике (рисунок 7).

ИНФОРМАЦИОННЫЙ АНАЛИЗ МИТТЕЛЬШПИЛЯ

Первый вариант (ничья).

Стремление белых быстрее провести пешку в ферзи приводит к ничейному результату. Черный король попадает в пешечный квадрат и забирает белую пешку.

Изменение энтропии и при такой игре приведено в таблице 3 и на графике (рисунок 5).

Второй вариант

(выигрыш белых).

Белые стремятся ограни чить поле маневра черного короля, то есть на каждом ходе пытаются минимизировать степень неопределенности (энтропию) черных. Эта стра-

Анализ миттельшпиля начнем с определения понятия оценочной функции, которая является индивидуальной для каждого игрока. Эта функция определяет поведение игрока во время партии, то есть приоритеты, которые он для себя выбирает. В частности, некоторые игроки отдают предпочтение слонам над конями, одни любят играть открытые позиции, другие стремятся к материальному преимуществу даже за счет некоторой потери активности фигур.

Будем предполагать, что в любой позиции шахматной партии теоретически можно рассчитать все исходы игры при различных ходах игроков. Поэтому можно утверждать, что в любой позиции существует определенный лучший ход, и вся игра сводится к поиску такого хода1 .

Поиск лучшего хода включает в себя два этапа: расчет всех возможных продолже-

Таблица 3.

Белые фигуры Черные фигуры

№ ход Р н I ход Р н I

1 Ь4 1/6 2,58 0,23 Кр£4 1/7 2,81 0,19

2 Ь5 1/5 2,32 0,26 Кре5 1/8 3 -0,19

3 Ь6 1/6 2,58 -0,26 Крё6 1/7 2,81 0,19

4 Ь7 1/6 2,58 0 Крс7 1/7 2,81 0

1 Однако поскольку число вариантов игры огромно, то в настоящее время не известно, имеют белые преимущество по сравнению с черными за счет первого хода или нет.

В В

I II I

7 6 1 9

Рисунок 6.

ний до определенной глубины и оценка каждой из возникающих позиций с помощью оценочной функции.

Возможны два варианта поиска:

1. Расчет позиции до самого конца.

Такой метод неосуществим из-за лавинообразно возрастающего количества позиций при увеличении глубины расчета.

2. Расчет на глубину в несколько ходов, а затем для выбора хода использование оценочной функции. Ход делается в ту позицию, которая имеет наиболее высокую оценку.

Расчет ходов представляет собой обычный перебор всех ходов по очереди в определенной последовательности с построением дерева расчета, то есть сначала делает ход первый игрок, затем в каждой из получившихся позиций делает ход второй игрок, в позициях следующей глубины ходит опять первый игрок и т. д. (рисунок 6).

В какой-то момент расчет прекращается, и каждая из получившихся позиций оценивается оценочной функцией, которая учитывает некоторые статические признаки позиции (например, материальное соотношение сил, степень свободы игроков).

Рисунок 7.

Введем понятие оценочной функции. Оценочной функцией будем называть функцию, которая каждой позиции на основе ее количественных и качественных признаков ставит в соответствие некоторое число. Сравнению различных позиций соответствует сравнение значений оценочной функции.

Целевая функция игрока при этом будет представлять собой разность оценки позиции после хода и оценки позиции перед ходом. Игроку следует ходить так, чтобы значение целевой функции, то есть изменение оценочной функции ЛБ, было максимальным. Так как перед ходом игрока оценка позиции постоянна, то игрок должен всегда ходить в ту позицию, оценка которой выше оценок остальных позиций.

На первом этапе анализа игры можно использовать любую достаточно простую оценочную функцию, а в дальнейшем ее усовершенствовать.

Предположим, что оценочная функция является кусочно-непрерывной функцией, то есть она зависит от стадии партии.

Таблица 4.

Белые фигуры Черные фигуры

№ ход Р Н I Р Н I

1 КРЕ5 1/1 2,81 0 Кр£3 1/6 2,58 0,42

2 Кр£5 1/1 2,81 0 Кре3 1/6 2,58 0

3 Кре5 1/1 2,81 0 Крё3 1/5 2,32 -0,26

4 Крё5 1/1 2,81 0 Крс2 1/6 2,58 0,26

5 Ь4 1/9 3,11 -0,36 - - - -

В дебюте основная цель игрока - получить хорошее развитие фигур, то есть повысить их активность и одновременно сдержать развитие фигур противника. Вид оценочной функции будет определяться энтропией позиции.

В эндшпиле количество ходов, оставшихся до конца партии, как правило, мало, и результат игры может быть просчитан.

В миттельшпиле происходит основная борьба, во время которой изменяется степень неопределенности игроков, ценность и количество фигур. Выбор стратегии игры связан с определением оценочной функции противника. Зная эту функцию, можно создать такие условия, при которых противник, совершая ходы в соответствии со своими установками, проиграет.

Покажем, как, анализируя игру противника, можно определить его целевую функцию. На первом этапе исследования целевую функцию противника естественно представить состоящей из двух компонент -материальной и фактора свободы (общее количество возможных ходов или энтропия).

Пусть целевая функция имеет вид:

Р=8,5хФ +5,5х^+3 хС +2хХ+1хЯ+ахН (1).

здесь Ф - разность количеств ферзей, Л -разность ладей, С - разность слонов, К -разность коней, П - разность пешек противников, Н - разность энтропий противников.

Проанализируем следующую позицию (рисунок 8), возникшую во время игры

Рассмотрим два возможных продолжения.

1. d5. При этом ходе не происходит взятия фигур (рисунок 9), и целевая функция имеет вид Р = аН . Белые имеют 33 различных продолжения Нб = ^233 = 5,04. Черные имеют 25 различных продолжений Н = ^225 = 4,64. Следовательно -Р = 0,4а.

2. de. При этом происходит взятие пешки (рисунок 10). Целевая функция примет вид Р = 1 + аН. Белые имеют 35 различных продолжений Нб = 5,13, черные -38 различных продолжений Н = 5,25. Р = 1 - 0,21а .

Пусть противник из рассматриваемых ходов выбрал второй вариант de. В этом случае, сравнивая значения оценочной функции, можно записать 0,4а < 1 - 0,21а или а < 1,93. Для уточнения целевой функции проанализируем следующую позицию, возникшую при игре с тем же противником (рисунок 11).

Проанализируем два возможных продолжения

1. К : П - Л : 17; С : 17 - Кр : V (рисунок 12).

Целевая функция будет иметь следующий вид: Р = 5 +1 - 3 - 2,5 + ахН. Нб = к^229 = 4,86. Нч = к^239 = 5,28. Следовательно, Р = 0,5 -ах 0,42.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. 14 (рисунок 13).

Целевая функция равна Р = а х Н. Белые имеют 43 различных продолжения, следовательно, Нб = ^243 = 5,43, черные имеют 31 продолжение - Нч = ^231 = 4,95. Р = а х 0,48.

Рисунок 8. Рисунок 9.

Рисунок 10.

Рисунок 11.

Рисунок 12.

Предположим, что белые сделали ход 14, то есть 0,5 - а X 0,42 < а X 0,48 . Отсюда следует а > 0,56 . Окончательно получим

0,56 < а < 1,93 . (2)

Если рассмотреть большее число позиций, то полученная оценка может быть уточнена.

Заметим, что данный подход позволяет не только определять коэффициенты целевой функции, но даже усложнить ее, то есть ввести нелинейные зависимости.

Покажем, как может быть использовано знание целевой функции противника (1), (2) при игре.

Пусть в партии возникла следующая позиция (рисунок 14).

Белые могут сделать спокойный ход, например Ь2 - Ь3, или агрессивный ход, например КО - е5.

1. Ь2 - Ь3. (рисунок 15).

Рассмотрев все варианты игры за черных, белые придут к выводу, что они сходят С§4 - £3, так как при этом ходе оценочная функция максимальна.

Рисунок 13.

Это положение нейтральное, поэтому знание оценочной функции не принесло белым никакого преимущества.

2. К£3 - е5 (рисунок 16).

Черные выберут ход с максимальным значением целевой функции, то есть они сходят С§5 - а1. Б = 9 -1 + аИ.

И = 4,9068 - 4,1548 = 0,152;

8,08 < ^ < 8,25.

При этом они попадут в заведомо проигранное продолжение. Выигрыш достигается следующим форсированным вариантом: Сс4 - Г7+; Кре8 - е7; Кс3 - а5 X.

Правильным ответом черных является ход de. После этого белые берут слона -Е: §4, и черные в итоге теряют пешку. Целевая функция при этом равна: Б = -1 + аН.

Н = 5,1293 - 5,4918 = - 0,3625;

-1,1994 < ^ <-1,5945.

Построенная целевая функция (1, 2) не учитывает такие важные факторы оценки позиции, как владение открытыми линиями и центром, подвижность фигур, наличие сдвоенных пешек, безопасность короля и т. д.

А П Г Г| Г Г Г-. ||

Рисунок 16.

ЭЛЕМЕНТЫ РЕФЛЕКСИВНОГО УПРАВЛЕНИЯ

При игре в шахматы с человеком, всегда имеет огромное значение так называемый «человеческий фактор». Каждый игрок, для того чтобы принимать правильное решение, пытается получить дополнительную информацию об оценочной функции противника и дезинформировать его о своей оценочной функции.

Процесс дезинформации противника, то есть процесс, в результате которого у противника появляются основания для принятия решения, выгодного передающей стороне, называется рефлексивным управлением.

Рефлексивным управлением считается любое обманное движение: ложь, интриги, провокации, маскировки. Приведем пример использования знания целевой функции противника для рефлексивного управления.

Рассмотрим игру двух игроков X и У. X пытается осуществить управление процессом принятия решения У. Это управление осуществляется не в результате прямого навязывания противнику своей воли, а за счет передачи ему «оснований», из которых тот как бы дедуктивно выведет предопределенное другим противником решение.

Пусть по результатам нескольких партий X узнал целевую функцию У, а У, в свою очередь, вычислил целевую функцию X. Передача «оснований» игроком X заключается в совершении определенных ходов, которые дезинформируют У о целевой функции X. Игрок X намеренно совершает

Рисунок 17.

ходы, не согласующиеся с его целевой функцией. В то время, когда У вычислил неправильную функцию и ожидает ходов, согласующихся с новой целевой функцией, X получает решающее преимущество, так как он знает следующие ходы противника, а противник не знает его следующего хода1.

Смоделируем следующую игровую ситуацию. Белые имеют целевую функцию:

/ = 8,5Ф + 5,5Л + 3,5С + 2К + 1,5П + 3Н. (1)

После нескольких сыгранных партий черные получили оценку этой функции

#(а) = 9Ф + 5Л + 3С + 2,5К + 1П + аН, (2)

где 1 < а < 4.

Для того чтобы заставить черных изменить представление о своей целевой функции белые сделали ход, который противоречит исходной функции (1).

Пусть возникла следующая позиция (рисунок 17).

Если следовать оценочной функции (1), то белые должны сделать ход d3:e4, так как при этом ходе целевая функция максимальна и равна f = -2 + 3Н = -2,21. Белые делают ход Фе1 - П. Черные определяют оценочную функцию белых по следующему алгоритму:

1) Если белые сделали ход Фе1 - Г2, то это означает, что оценочная функция при этом ходе принимает большее значение, чем при ходе d3 - е4.

1 Хорошо известен такой феномен в игре человека с человеком: если один игрок допустил промах, то часто второй игрок тоже вскоре допускает промах. По-видимому, первый промах воспринимается противником как искажение целевой функции партнера и вызывает адекватное изменение целевой функции второго игрока.

2) Черные определяют границы неизвестного параметра.

а) Фе1 - £2. g1 (а) = -3П + аН = -3 + 0,12а.

б) d3: е4. g2 (а) = -2П + аН = -2 - 0,16а.

Следовательно, g1 > g2 и а > 3,6.

Черные, вычислив новую (ложную) оценочную функцию белых, будут определять по ней ответ белых.

Черные делают ход е4:d3 (рисунок 18).

По представлению черных, белые должны ответить с2: d3, так как целевая функция при этом ходе максимальна, а ход выбирается по максимуму целевой функции.

Но белые играют по своей старой оценочной функции ФП: а7.

Это действительно лучший ход, после которого возникает форсированный вариант выигрыша белых.

ЗАКЛЮЧЕНИЕ

Проведенный в работе анализ показывает принципиальную возможность построения самообучающейся игровой шахматной программы. Практически все, кто играл в шахматы с компьютером, отмечают «холодность» игры. Один из известных гроссмейстеров сравнил игру с компьютером игрой в теннис со стенкой. Программы нового вида позволят учесть психологию игрока, то есть уровень игры программы можно будет подстраивать под уровень человека. В эту программу можно естественным образом внести генератор оши-

Литература

бок, то есть возможность создания нестандартной игровой ситуации.

Второй широко известной и популярной игрой с полной информацией являются шашки. Хотя эта игра и похожа на шахматы, но существенно отличается по выбору стратегии игры и информационному описанию. Например, в дебюте, в отличие от шахмат, степень свободы шашечных фигур почти минимальна, и только в эндшпиле она достигает максимума. Заметим, что для анализа этой игры может быть использован информационный анализ.

В выполнении работы самое активное участие принимали Гаврилов Андрей (школа № 82), Симонова Катя (школа № 135), Коновалов Сергей (школа № 38). Ими были написаны две программы на языке С++ и Паскаль, позволяющие проводить информационный анализ как шахматных, так и шашечных партий. Результаты работы представлялись на Всероссийской научной конференции «Юниор-2005» и были отмечены дипломом третьей степени.

Рисунок 18.

1. Гик Е.Я. Шахматы и математика. М.: Наука 1983. 172 с.

2. Лефевр В.А. Конфликтующие структуры. «Советское радио», 1973. 158 с.

3. Яглом А.М., Яглом И.М. Вероятность и информация. М., 1973. 315 с.

4. Шенон К. Работы по теории информации и кибернетике. М., 1963. 829 с.

5. Лысенко А.В. Оценка позиции. М., 1990. 236 с.

Ляхов Александр Федорович, доцент кафедры теоретической механики механико-математического факультета Нижегородского государственного университета им. Н.И. Лобачевского (НГУ).

© 1авторы, 2005. Our authors, 2005.

i Надоели баннеры? Вы всегда можете отключить рекламу.